1
幻覚問題の解決:RAGオープンブック手法
EvoClass-AI005Lecture 4
00:00

プロフェッショナルな環境でのAI活用における主な障壁は、 幻覚問題です。これは、大規模言語モデル(LLM)がトレーニングデータ内のパターンに頼らざるを得ないため、実時間で検証された情報ではなく、自信を持って事実や日付、出典を捏造してしまう状況を指します。

1. 「クローズドブック」から「オープンブック」へ

ほとんどのユーザーは、モデルが内部の重み(メモリ)にのみ依存する「クローズドブック」の形でAIとやり取りしています。プロフェッショナルレベルの正確さを達成するためには、 リトリーバー補強生成(RAG)という「オープンブック試験」の手法に移行します。この方法では、回答を生成する前に、特定で関連性のある文書をAIに参照させることが可能になります。

2. LLMを推論エンジンとして活用する

RAGフレームワークでは、LLMは静的なデータベースとして機能するのではなく、推論エンジンとして機能し始めます。質問をすると、システムはあなたの「第二脳」(整理されたPDFやノート)から関連する文章を取得し、コンテキストとして提示します。モデルの役割は「記憶からの想起」から「提示された事実の要約と統合」へと変化します。これにより、出力が特定のデータに基づいており、以下の論理式で表現されるように保証されます:

$$ \text{応答} = \text{LLM}(\text{クエリ} + \text{コンテキスト}) $$

RAGロジックフロー
Question 1
Why do LLMs "hallucinate" in a professional context?
They are programmed to lie to the user.
They try to predict the next word based on outdated or insufficient training data.
They have too much access to real-time internet data.
Question 2
In the RAG methodology, what is the primary purpose of the "Context"?
To make the prompt longer and more expensive.
To provide a factual anchor that prevents the model from drifting into invention.
To teach the model a new language.
Challenge: Reducing Error Probability
Applying RAG principles to legal documents.
You need to use an AI to summarize a 50-page legal contract without it making up clauses.
Step 1
Identify the "Search Space" for the AI.
Solution:
Instead of asking general questions, upload the PDF to a RAG-enabled tool (like NotebookLM) to constrain the AI’s search space strictly to that specific document.